神经网络的出现彻底改变了运动合成领域。然而,学会从给定的分布中无条件合成动作仍然是一项具有挑战性的任务,尤其是当动作高度多样化时。我们提出了Modi,这是一种无条件的生成模型,可以合成各种动作。我们的模型在完全无监督的环境中训练,从多样化,非结构化和未标记的运动数据集中进行了训练,并产生了一个行为良好,高度语义的潜在空间。我们的模型的设计遵循StyleGAN的多产架构,并将其两个关键技术组件调整为运动域:一组样式编码,这些样式编码注入了生成器层次结构的每个级别和映射功能,并形成了一个学习和形成一个分离的潜在空间。我们表明,尽管数据集中缺乏任何结构,但潜在空间可以在语义上聚集,并促进语义编辑和运动插值。此外,我们提出了一种将未见动作转向潜在空间的技术,并展示了基于潜在的运动编辑操作,否则这些动作无法通过天真地操纵明确的运动表示无法实现。我们的定性和定量实验表明,我们的框架达到了最新的合成质量,可以遵循高度多样化的运动数据集的分布。代码和训练有素的模型将在https://sigal-raab.github.io/modi上发布。
translated by 谷歌翻译
Omnipredictors(Gopalan,Kalai,Reingold,Sharan和Wieder ITCS 2021)的概念提出了一种新的损失最小化范式。与损失损失$ c $相比,无需基于已知的损失功能学习预测指标,而是可以轻松地进行后处理以最大程度地减少任何丰富的损失功能家族。已经表明,这种杂手已经存在,并暗示(对于所有凸和Lipschitz损失函数),通过算法公平文献的多核概念的概念。然而,通常情况下,所选的动作必须遵守一些其他约束(例如能力或奇偶校验约束)。总体而言,全能器的原始概念并不适用于这种良好动机和大量研究的损失最小化的背景。在本文中,我们介绍了综合器,以进行约束优化并研究其复杂性和含义。我们介绍的概念使学习者不知道后来将分配的损失函数以及后来将施加的约束,只要已知用于定义这些约束的亚群的范围。该论文显示了如何依靠适当的多核变体获得限制优化问题的全能器。对于一些有趣的约束和一般损失函数以及一般约束和一些有趣的损失函数,我们显示了如何通过多核的变体隐含的,该变体的复杂性与标准的多核电相似。我们证明,在一般情况下,标准的数学启动不足,表明全能器是通过相对于包含$ c $中所有级别假设集的类的多核算来暗示的。我们还研究了约束是群体公平概念时的含义。
translated by 谷歌翻译
牙齿疾病是最常见的慢性疾病之一,尽管可以预防。但是,关于最佳口腔卫生实践的专业建议通常被患者遗忘或放弃。因此,患者可能会受益于及时和个性化的鼓励来进行口腔自我保健行为。在本文中,我们开发了一种在线增强学习(RL)算法,用于优化基于移动的提示以鼓励口腔卫生行为的交付。开发这种算法的主要挑战之一是确保算法考虑当前行动对未来行动有效性(即延迟效应)的影响,尤其是当使算法变得稳定,自动运行时,尤其是当该算法变得简单时在受约束的现实世界中(即高度嘈杂,稀疏的数据)中。我们通过设计质量奖励来应对这一挑战,从而最大程度地提高所需的健康结果(即高质量的刷牙),同时最大程度地减少用户负担。我们还强调了一个程序,可以通过构建模拟环境测试床并使用测试床评估候选人来优化奖励的超参数。本文讨论的RL算法将用于Oralytics,这是一种口头自我护理应用程序,提供行为策略,以促进患者参与口腔卫生实践。
translated by 谷歌翻译
近年来,文本发现的主要范例是将文本检测和识别的任务结合到一个端到端的框架中。在此范式下,这两个任务都是通过从输入图像中提取的共享全局特征图操作来完成的。端到端方法面临的主要挑战之一是识别跨音阶变化(较小或较大的文本)和任意单词旋转角的文本时的性能退化。在这项工作中,我们通过提出一种新型的全球到本地关注机制来解决这些挑战,用于文本斑点,称为玻璃,将全球和本地特征融合在一起。全局功能是从共享骨干线中提取的,从整个图像中保留上下文信息,而本地功能则在调整大小的高分辨率旋转的单词作物上单独计算。从当地农作物中提取的信息减轻了尺度和单词旋转的许多固有困难。我们显示了跨音阶和角度的性能分析,突出了尺度和角度的肢体的改善。此外,我们引入了一个方向感知的损失项,以监督检测任务,并显示其对所有角度的检测和识别性能的贡献。最后,我们通过将玻璃纳入其他领先的文本发现架构,改善其文本斑点性能来表明玻璃是一般的。我们的方法在包括新发布的Textocr在内的多个基准上实现了最新的结果。
translated by 谷歌翻译
文本生成模型已成为许多研究任务,尤其是句子语料库的生成焦点。但是,了解自动生成的文本语料库的属性仍然具有挑战性。我们建议一组检查生成文本语料库的属性的工具。将这些工具应用于各种生成的语料库中,使我们能够对生成模型的属性获得新的见解。作为我们特征过程的一部分,我们发现了两种主要生成技术产生的语料库存在显着差异。
translated by 谷歌翻译
预期模型的大小正在增加,它们在各种NLP任务上的性能也在增加。但是,随着记忆能力的增长,他们可能会增加更多的社会偏见。在这项工作中,我们检查了模型大小及其性别偏见之间的联系(特别是职业性别偏见)。我们在两个设置中测量三个蒙版语言模型家族(Roberta,Deberta和T5)中的偏见:直接使用基于提示的方法,并使用下游任务(Winogender)。一方面,我们发现较大的模型在以前的任务上获得了更高的偏差分数,但是当对后者进行评估时,它们会造成更少的性别错误。为了检查这些潜在的矛盾结果,我们仔细研究了Winogender不同模型的行为。我们发现,尽管较大的模型的表现要比较小的模型,但其错误是由性别偏见引起的概率。此外,我们发现,与抗疾病的型号相比,刻板印象误差的比例随模型大小而生长。我们的发现突出了增加模型大小可能引起的潜在风险。
translated by 谷歌翻译
人类已经依靠机器将过多的信息减少到可管理的表示形式。但是可以滥用这种依赖 - 战略机器可能会制定操纵用户的表示。用户如何根据战略表示做出很好的选择?我们将其正式化为学习问题,并追求算法来进行操纵。在我们关注的主要环境中,系统将项目的属性表示给用户,后者决定是否消耗。我们通过战略分类的镜头(Hardt等人,2016年)对这种相互作用进行建模,逆转:学习,首先播放的用户;响应的系统排名第二。该系统必须以揭示“除了真理”但不必揭示整个真理的表示形式做出响应。因此,用户在战略子集选择下面临学习设置功能的问题,该选项提出了不同的算法和统计挑战。我们的主要结果是一种学习算法,尽管具有战略代表性,该算法可以最大程度地减少错误,而我们的理论分析阐明了学习工作和操纵易感性之间的权衡。
translated by 谷歌翻译
在线增强学习(RL)算法越来越多地用于个性化移动健康和在线教育领域的数字干预措施。在这些设置中设计和测试RL算法方面的常见挑战包括确保RL算法在实时约束下可以稳定学习和运行,并考虑了环境的复杂性,例如,缺乏用于用户动力学的准确机械模型。为了指导人们如何应对这些挑战,我们将PC(可预测性,可计算性,稳定性)框架扩展到了一个数据科学框架,该框架结合了监督学习中的机器学习和统计数据的最佳实践(Yu and Kumbier,2020年),用于数字干预设置的RL算法。此外,我们提供有关如何设计仿真环境的准则,这是使用PCS框架评估RL候选算法的关键工具。我们说明了使用PCS框架来设计Oralytics的RL算法,这是一项移动健康研究,旨在通过个性化的干预消息来改善用户的牙刷行为。 Oralytics将于2022年底进入该领域。
translated by 谷歌翻译
生态瞬间评估(EMAS)是用于测量移动卫生(MHECHEATH)研究和治疗方案的当前认知状态,影响,行为和环境因素的重要心理数据源。非反应,其中参与者未能响应EMA提示,是一个地方问题。准确预测非响应的能力可用于改善EMA交付和发展顺应性干预。事先工作已经探索了古典机器学习模型,以预测非反应。然而,正如越来越大的EMA数据集可用,有可能利用在其他领域有效的深度学习模型。最近,变压器模型在NLP和其他域中显示了最先进的性能。这项工作是第一个探索用于EMA数据分析的变压器的使用。我们在将变压器应用于EMA数据时解决了三个关键问题:1。输入表示,2.编码时间信息,3.预先培训提高下游预测任务性能的效用。变压器模型实现了0.77的非响应预测AUC,并且明显优于古典ML和基于LSTM的深度学习模型。我们将使我们的一个预测模型在研究界可自由地提供40k EMA样品的核查,以便于开发未来的基于变压器的EMA分析工作。
translated by 谷歌翻译